智能论文笔记

A Deep Learning Method for Real-time Bias Correction of Wind Field Forecasts in the Western North Pacific

Wei Zhang , Yueyue Jiang , Junyu Dong , Xiaojiang Song , Renbo Pang , Boyu Guoan , Hui Yu

分类：人工智能 | 计算机视觉

2022-12-29

Forecasts by the European Centre for Medium-Range Weather Forecasts (ECMWF; EC for short) can provide a basis for the establishment of maritime-disaster warning systems, but they contain some systematic biases.The fifth-generation EC atmospheric reanalysis (ERA5) data have high accuracy, but are delayed by about 5 days. To overcome this issue, a spatiotemporal deep-learning method could be used for nonlinear mapping between EC and ERA5 data, which would improve the quality of EC wind forecast data in real time. In this study, we developed the Multi-Task-Double Encoder Trajectory Gated Recurrent Unit (MT-DETrajGRU) model, which uses an improved double-encoder forecaster architecture to model the spatiotemporal sequence of the U and V components of the wind field; we designed a multi-task learning loss function to correct wind speed and wind direction simultaneously using only one model. The study area was the western North Pacific (WNP), and real-time rolling bias corrections were made for 10-day wind-field forecasts released by the EC between December 2020 and November 2021, divided into four seasons. Compared with the original EC forecasts, after correction using the MT-DETrajGRU model the wind speed and wind direction biases in the four seasons were reduced by 8-11% and 9-14%, respectively. In addition, the proposed method modelled the data uniformly under different weather conditions. The correction performance under normal and typhoon conditions was comparable, indicating that the data-driven mode constructed here is robust and generalizable.

translated by 谷歌翻译

Physical Adversarial Attack meets Computer Vision: A Decade Survey

Hui Wei , Hao Tang , Xuemei Jia , Hanxun Yu , Zhubo Li , Zhixiang Wang , Shin'ichi Satoh , Zheng Wang

分类：计算机视觉

2022-09-30

Although Deep Neural Networks (DNNs) have achieved impressive results in computer vision, their exposed vulnerability to adversarial attacks remains a serious concern. A series of works has shown that by adding elaborate perturbations to images, DNNs could have catastrophic degradation in performance metrics. And this phenomenon does not only exist in the digital space but also in the physical space. Therefore, estimating the security of these DNNs-based systems is critical for safely deploying them in the real world, especially for security-critical applications, e.g., autonomous cars, video surveillance, and medical diagnosis. In this paper, we focus on physical adversarial attacks and provide a comprehensive survey of over 150 existing papers. We first clarify the concept of the physical adversarial attack and analyze its characteristics. Then, we define the adversarial medium, essential to perform attacks in the physical world. Next, we present the physical adversarial attack methods in task order: classification, detection, and re-identification, and introduce their performance in solving the trilemma: effectiveness, stealthiness, and robustness. In the end, we discuss the current challenges and potential future directions.

translated by 谷歌翻译

WeLM: A Well-Read Pre-trained Language Model for Chinese

Hui Su , Xiao Zhou , Houjing Yu , Yuwen Chen , Zilin Zhu , Yang Yu , Jie Zhou

分类：自然语言处理 | 人工智能

2022-09-21

通过自我监督的学习预先训练的大型语言模型在各种各样的任务上表现出令人印象深刻的零击功能。在这项工作中，我们介绍了Welm：一种针对中文的精心读取的预训练的语言模型，能够无缝执行不同类型的任务，以零或几次演示。 Welm通过“阅读”涵盖广泛主题的精选高质量语料库来接受10b参数的培训。我们表明，韦尔姆拥有有关各种领域和语言的广泛知识。在18个单语（中文）任务中，WELM可以大大优于现有的预训练模型，尺寸相似，并匹配高达25倍大的模型的性能。韦尔姆还表现出强大的多种语言和代码转换理解的能力，优于预先对30种语言进行预培训的现有多语言模型。此外，我们收集了人工编写的提示，并通过多次培训进行了大量的中文和微调韦尔姆的监督数据集。最终的模型可以实现对看不见的任务类型的强烈概括，并在零射门学习中优于无监督的韦尔姆。最后，我们证明韦尔姆具有解释和校准自己的决策的基本技能，这可能是未来研究的有希望的方向。我们的模型可以从https://welm.weixin.qq.com/docs/api/应用。

translated by 谷歌翻译

Hand and Arm Gesture-based Human-Robot Interaction: A Review

Xihao Wang , Hao Shen , Hui Yu , Jielong Guo , Xian Wei

分类：机器人

2022-09-17

人类机器人互动（HRI）的研究旨在建立人与机器人之间的紧密而友好的沟通。在以人为中心的HRI中，实施成功有效的HRI的一个重要方面是建立自然而直观的互动，包括口头和非语言。作为一种普遍的非言语沟通方法，在我们的日常生活中，手势和手臂手势沟通无处不在。基于手势的HRI的大量工作散布在各种研究领域。但是，仍然缺乏对基于手势的HRI作品的系统理解。本文旨在对基于手势的HRI进行全面审查，并专注于该领域的高级发现。遵循刺激和生物反应框架，该综述包括：（i）产生人类手势（刺激）。（ii）机器人识别人类手势（有机体）。（iii）机器人对人手势的反应（反应）。此外，本综述总结了框架中每个元素的研究状态，并分析相关工作的优势和缺点。在最后一部分中，本文讨论了有关基于手势的HRI的当前研究挑战，并提供了未来的方向。

translated by 谷歌翻译

Application of Data Encryption in Chinese Named Entity Recognition

Kaifang Long , Jikun Dong , Shengyu Fan , Yanfang Geng , Yang Cao , Han Zhao , Hui Yu , Weizhi Xu

分类：自然语言处理

2022-08-31

最近，随着深度学习的持续发展，指定实体识别任务的表现得到了极大的改进。但是，在某些特定领域（例如生物医学和军事）中数据的隐私和机密性导致数据不足以支持深度神经网络的培训。在本文中，我们提出了一个加密学习框架，以解决数据泄漏的问题以及对某些域中敏感数据的不便披露。我们首次将多个加密算法介绍以在指定实体识别任务中加密培训数据。换句话说，我们使用加密数据训练深神网络。我们在六个中国数据集上进行实验，其中三个是由我们自己构建的。实验结果表明，加密方法可实现令人满意的结果。一些经过加密数据训练的模型的性能甚至超过了未加密方法的性能，该方法验证了引入的加密方法的有效性，并在一定程度上解决了数据泄漏问题。

translated by 谷歌翻译

HTML版本

Latent Heterogeneous Graph Network for Incomplete Multi-View Learning

Pengfei Zhu , Xinjie Yao , Yu Wang , Meng Cao , Binyuan Hui , Shuai Zhao , Qinghua Hu

分类：机器学习 | 计算机视觉

2022-08-29

近年来，多视图学习迅速发展。尽管许多先前的研究都认为每个实例都出现在所有视图中，但在现实世界应用程序中很常见，从某些视图中丢失实例，从而导致多视图数据不完整。为了解决这个问题，我们提出了一个新型潜在的异质图网络（LHGN），以实现不完整的多视图学习，该学习旨在以灵活的方式尽可能充分地使用多个不完整的视图。通过学习统一的潜在代表，隐含地实现了不同观点之间一致性和互补性之间的权衡。为了探索样本与潜在表示之间的复杂关系，首次提出了邻域约束和视图约束，以构建异质图。最后，为了避免训练和测试阶段之间的任何不一致之处，基于图形学习的分类任务应用了转导学习技术。对现实世界数据集的广泛实验结果证明了我们模型对现有最新方法的有效性。

translated by 谷歌翻译

MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base

Hui Li , Xuekang Yang , Xin Zhao , Lin Yu , Jiping Zheng , Wei Sun

分类：自然语言处理

2022-07-28

事实证明，将先验知识纳入预训练的语言模型中对知识驱动的NLP任务有效，例如实体键入和关系提取。当前的培训程序通常通过使用知识掩盖，知识融合和知识更换将外部知识注入模型。但是，输入句子中包含的事实信息尚未完全开采，并且尚未严格检查注射的外部知识。结果，无法完全利用上下文信息，并将引入额外的噪音，或者注入的知识量受到限制。为了解决这些问题，我们提出了MLRIP，该MLRIP修改了Ernie-Baidu提出的知识掩盖策略，并引入了两阶段的实体替代策略。进行全面分析的广泛实验说明了MLRIP在军事知识驱动的NLP任务中基于BERT的模型的优势。

translated by 谷歌翻译

Product Segmentation Newsvendor Problems: A Robust Learning Approach

Xiaoli Yan , Hui Yu , Jiawen Li , Frank Youhua Chen

分类：机器学习

2022-07-08

我们提出和分析产品细分新闻供应商问题，该问题概括了一系列可腐烂项目的细分销售现象。产品细分新闻册问题是新闻企业问题的新变体，反映出卖方通过在不确定的子项目需求的背景下确定整个项目的库存来最大化利润。我们通过假设随机需求的平均值和协方差矩阵来得出封闭形式的稳健订购决定，但不能提供分布。但是，在最糟糕的需求情况下总是在解决方案保守主义方面始终保持权衡的强大方法。因此，传统的健壮方案提供了不令人满意的。在本文中，我们整合了强大而深厚的增强学习（DRL）技术，并提出了一种新的范式，称为强大的学习，以提高强大的政策的吸引力。值得注意的是，我们将强大的决定作为人类领域的知识做出，并通过设计完整的人机协作经验，规范决策和正则化回报，将其实施到DRL的培训过程中。仿真结果证实，我们的方法有效地提高了稳健的性能，并可以推广到需要强大但不保守的解决方案的各种问题。同时，较少的培训情节，提高训练稳定性以及行为的解释性可能有机会促进运营实践中DRL算法的部署。此外，RLDQN解决1000维需求方案的成功尝试表明，该算法为通过人机协作解决了复杂的操作问题提供了一条途径，并可能具有解决其他复杂的运营管理问题的潜在意义。

translated by 谷歌翻译

DaisyRec 2.0: Benchmarking Recommendation for Rigorous Evaluation

Zhu Sun , Hui Fang , Jie Yang , Xinghua Qu , Hongyang Liu , Di Yu , Yew-Soon Ong , Jie Zhang

分类：机器学习

2022-06-22

最近，在推荐系统领域中，一个关键问题隐约可见 - 没有进行严格评估的有效基准 - 因此，这会导致不可再生的评估和不公平的比较。因此，我们从实践理论和实验的角度进行研究，目的是为严格的评估做出基准建议。关于理论研究，一系列影响整个评估链中建议性能的超级因素通过对2017 - 2020年在八个顶级会议上发表的141篇论文进行的详尽评价进行了系统的总结和分析。然后，我们将它们分类为独立于模型和模型依赖性的超因子，并相应地定义和讨论了不同的严格评估模式。在实验研究中，我们通过将这些超级因子整合以进行严格的评估来发布DaisyREC 2.0文库，从而进行了整体经验研究，以揭示不同超级效应器对建议性能的影响。在理论和实验研究的支持下，我们最终通过提出标准化程序并在六个数据集上的六个评估指标中提供10个最先进的方法来创建严格评估的基准，以作为以后研究的参考。总体而言，我们的工作阐明了建议评估中的问题，为严格的评估提供了潜在的解决方案，并为进一步调查提供了基础。

translated by 谷歌翻译

Synthesizing Tensor Transformations for Visual Self-attention

Xian Wei , Xihao Wang , Hai Lan , JiaMing Lei , Yanhui Huang , Hui Yu , Jian Yang

分类：计算机视觉 | 机器学习

2022-01-05

自我关注在捕获远程关系时，在提高视觉任务的表现，例如图像分类和图像标题等方面，突出的能力。然而，自我关注模块高度依赖于查询键值特征之间的点产品乘法和维度对齐，这导致两个问题：（1）点产品乘法导致穷举和冗余计算。（2）由于视觉特征图通常出现作为多维张量，重塑张量特征的尺度，以适应尺寸对齐可能会破坏张量特征图的内部结构。为了解决这些问题，本文提出了一种具有其变体的自我关注插入模块，即合成张量变换（STT），用于直接处理图像张量特征。如果在查询键值之间计算点 - 产品乘法，则基本STT由张量转换组成，以从视觉信息中学习合成注意力。 STT系列的有效性在图像分类和图像标题上验证。实验表明，建议的STT实现了竞争性能，同时保持鲁棒性与基于视觉任务的自我关注相比。

translated by 谷歌翻译